AI产业链地图·知识库 DeepSeek V3 · 概念
🚧 网站建设中 更新 2026·06·17 → 产业链图谱
首页/概念/DeepSeek V3
更新 2026·06·17
概念 技术 / 术语

DeepSeek V3

DeepSeek-V3 · V3

DeepSeek V3 的战略意义远超技术本身

DeepSeek V3 CONCEPT · 概念
首次提出
2024
关键参与方
[[DeepSeek]] · [[幻方量化]]
反向引用
13 处 · 来自 8
归属 大模型开源模型DeepSeekMoE第四层

DeepSeek V3

DeepSeek(深度求索,幻方量化 旗下 AI 公司)2024-12 发布的开源 MoE 大模型,671B 总参数 / 37B 激活,训练成本仅约 $560 万(行业震撼),是 2025-01 引发"DeepSeek 时刻"全球资本市场地震的核心产品。

关键规格

维度 数值
发布 2024-12-26
参数 671B 总 / 37B 激活(MoE)
上下文 128K tokens
训练数据 14.8T tokens
训练成本 $5.576M(H800 集群 280 万 GPU 小时)
模态 文本(多模态版后续推出)
许可证 MIT(完全开源、商业可用)

市场定位

DeepSeek V3 的战略意义远超技术本身

  • 训练成本震撼 —— $560 万对比 GPT-4 估算的 $1+ 亿、Llama 3.1 405B 的 ~$6,000 万,价格屠夫
  • 完全开源 MIT 许可 —— 比 Llama 社区许可更宽松
  • 算法效率突破 —— FP8 训练、Multi-Token Prediction、DualPipe 并行等多项创新
  • 2025-01 DeepSeek 时刻 —— NVIDIA 股价单日 -17%($6,000 亿市值蒸发),引发全行业算力需求重估

客户与部署

  • 企业自部署 —— 国内外公司大量基于 V3 二次开发
  • API 服务 —— DeepSeek 官方 API 价格仅 $0.27/M input cache hit
  • 云服务 —— 阿里云 / 火山引擎 / Together AI / Fireworks 等托管服务

演进路线

DeepSeek V1 / V2(2024-H1,小规模影响)→ DeepSeek V2.5(2024-09)→ DeepSeek V3(2024-12,引爆点)→ DeepSeek R1(2025-01,推理专精)→ DeepSeek V4(路线图)

关键来源

关联

↑ up::DeepSeek 幻方量化 ↓ down::4-04-模型部署与优化 5-04-AI编程助手 5-03-AIGC内容生成 ⚔ competitor::GPT-5 Claude Sonnet 4 Llama 4 Qwen3 豆包1.5 ∈ belongs_to::4-02-模型工厂